import xlrd

# 打开Excel文件
workbook = xlrd.open_workbook('新标日初级、中级单词表.xls')  # 注意：xlrd 仅支持旧版本的 .xls 文件，不支持 .xlsx

# 选择要读取的工作表，可以通过索引或名称
worksheet = workbook.sheet_by_index(0)  # 通过索引选择第一个工作表
# worksheet = workbook.sheet_by_name('Sheet1')  # 或者通过名称选择工作表

# 遍历每一行
data = []
for row_num in range(worksheet.nrows):
    row = worksheet.row_values(row_num)  # 获取当前行的所有值
    if row ==['', '', '', '', '', '', '', '', '']:
        continue
    #print(row)
    data.append(row)

chapt = {}
old = []
cur = ''
for row in data:
    if '新标初' in row[1]:
        chapt[row[1]] = []
        cur = row[1]

        continue
    if cur:
        chapt[cur].append(row)
print(chapt.keys())
chapt_std ={}
pd_data = []
for cht in chapt:
    data_cht = chapt[cht]
    chapt_std[cht] =[]
    for e in data_cht:
        print(e)
        chapt_std[cht].append({'日文':e[1],
                               '假名':e[3],
                               '中文':e[4],
                               '类型':e[8],
                               '课文':cht


                               })
        pd_data.append((e[1],e[3],e[4],e[8],cht))

print(chapt_std)
import pandas as pd
df = pd.DataFrame(pd_data,columns=['日文','假名','中文','类型','课文'])
df.to_excel('标日初级单词表.xlsx')